home *** CD-ROM | disk | FTP | other *** search
/ 2,000 Greater & Lesser Mysteries / 2,000 Greater and Lesser Mysteries.iso / internet / mys01108.txt < prev    next >
Encoding:
Text File  |  1994-06-10  |  25.6 KB  |  389 lines

  1.  
  2.  
  3. "Library Automation and the National Research Network," by Clifford A.
  4. Lynch, Director of the Division of Library Automation, University of
  5. California Office of the President.
  6.  
  7. First published in "EDUCOM Review," Volume 24, Number 3, Fall 1989, pp:
  8. 21-26. Editor: Sheldon B. Smith, EDUCOM, SMITH@EDUCOM
  9.  
  10. ***************************************************************************
  11. As a result of progress in library automation in the last decade, great
  12. changes have occurred in access to information within institutions.
  13. Emphasis has shifted from automating library operations to providing
  14. computer-based access to library collections. This transition has raised
  15. user expectations, and as a result, libraries face challenges in the coming
  16. decade that will be tremendously costly and technically difficult to meet.
  17.         Libraries have traditionally cooperated in operational activities
  18. such as cataloging through the national utilities like the Online Computer
  19. Library Center (OCLC) and Research Libraries Information Network (RLIN),
  20. and the formation of consortia for resource sharing through interlibrary
  21. loan. Only now are libraries becoming involved in movement toward national
  22. end-user resource sharing that is represented by the development of the
  23. national research network. They are just beginning to explore the ways in
  24. which national networks interact with interinstitutional resource sharing
  25. to support public access to information resources.
  26.         Drawing heavily on experience at the University of California, this
  27. article describes the current situation of automation at academic
  28. institutions.  It outlines some of the major issues that face library
  29. planners today and emphasizes the use of technologies such as nationwide
  30. computer networks to improve access to information.
  31.  
  32. Institutional Library Automation
  33.         From the late 1970s through the 1980s, libraries applied computer
  34. technology to create great changes in public access to their collections.
  35. While automation had been used much earlier to streamline the operational
  36. aspects of libraries (acquisitions, cataloging, and circulation of
  37. material, for example), by the beginning of the 1980s most libraries had
  38. created a critical mass of machine-readable data describing the contents of
  39. their collections that could be made available to the public.
  40.         At about the same time, the cost of the computing cycles and
  41. storage media necessary to support public-access information systems came
  42. within the reach of most library budgets.
  43.         Today, public-access online catalogs (of widely varying capability
  44. and quality) exist at most major research libraries. These systems provide
  45. access primarily to book collections; although access to journal titles is
  46. not uncommon, most systems do not provide it.  Since World War II,
  47. libraries generally have abdicated direct responsibility for providing
  48. access to the journal literature to other organizations (collectively
  49. called abstracting and indexing ser-vices). While limited in coverage,
  50. online catalogs permit collection searching that is vastly superior to the
  51. paper-based card catalogs they replaced. Collections that are
  52. geographically scattered can be searched in entirely new ways through
  53. online catalogs. Ten years ago, to identify all the books by a given author
  54. held in the roughly 100 libraries of the nine-campus University of
  55. California system, a researcher would have had to travel the state,
  56. consulting multiple card catalogs on most of the UC campuses. Locating all
  57. of the books published in the seventeenth century in the Portuguese
  58. language even at a single library would have been impossible, since the
  59. traditional card catalog was not designed for such searches. Today, using
  60. UCs MELVYL union catalog, a researcher can obtain a summary of all 127
  61. seventeenth-century publications in Portuguese held at any of the UC
  62. campuses with a single command.
  63.         Online catalogs are now major computer systems in their own right.
  64. The MELVYL system contains records for about 10 million holdings (about 5
  65. million different titles; many works are held at more than one library in
  66. the UC system). The MELVYL system processed about 1.25 million queries in
  67. May 1989, displaying over 11 million citations to its users. One can now
  68. search the entire UC library system from ones home or office at any time of
  69. the day or night. The online catalog has raised user expectations for
  70. library service; for example, there is growing pressure for delivery
  71. services linked to online catalogs that would allow users to obtain the
  72. material they have located, either electronically or through campus mail,
  73. and for access to the journal literature on an equal basis with the
  74. monographic literature. In many research libraries, about half of the
  75. acquisitions budget is spent on journals every year, and for students,
  76. practitioners, and scholars in many fields, the journal literature is
  77. perhaps a more vital resource than the monographic literature.
  78.         In the past two years, a number of major universities have begun to
  79. explore the provision of access to selected journal literature as part of
  80. the online catalog by licensing abstracting and indexing databases produced
  81. by commercial firms or by the government. The results of these experiments
  82. have staggered library planners by revealing the magnitude of the unmet
  83. demand for information. Prior to the mounting of these databases in library
  84. catalogs (where they are licensed on an institutional basis and typically
  85. made available to the user community at no direct cost), researchers could
  86. obtain access to the journal literature through commercial services such as
  87. DIALOG or BRS, but this access was (and is) very expensive (charges of $100
  88. an hour for searching are quite common) and difficult to achieve since
  89. these services were designed for use by trained searchers. There was no
  90. funding mechanism at most universities to support such access, except for
  91. an often halfhearted program to provide a few mediated searches each year
  92. for faculty members willing to go to the library and ask a librarian to
  93. conduct a search.
  94.         With support from the National Library of Medicine, the University
  95. of California has made the last three years of the MEDLINE database (about
  96. 750,000 citations in the biomedical and health sciences) available to its
  97. user community as part of the MELVYL catalog. In May 1989, this system
  98. processed about 175,000 queries and displayed over 2 million records. These
  99. statistics highlight several important changes. We have moved into a mass
  100. market for information. A typical MEDLINE search on a system like DIALOG
  101. might cost $10 or more, but the license fee for the MEDLINE database
  102. amounts to only a few cents per search (plus the cost of the computing
  103. resources necessary to support the database). The availability of easy
  104. access to information resources like MEDLINE is changing the way these
  105. databases are used to support research and instruction. They are becoming
  106. integrated into the academic programs, although there are serious questions
  107. arising about who should take primary responsibility for teaching people to
  108. use the resources and how the costs of the databases should be financed.
  109.         Extrapolating from the MEDLINE experience, which has provided
  110. access to only a single, narrow part of the total journal literature, it is
  111. clear that licensing, mounting, and providing support for access to the
  112. full journal literature will be a massive task that is probably beyond the
  113. capabilities and resources of any single institution. The difficulty here
  114. is not simply in finding the money for license fees and for computing
  115. hardware to support the databases as they are acquired (although both of
  116. these are problems); huge human resources also are necessary to build
  117. high-quality database implementations and to support them through training
  118. and user services programs once they are built.
  119.         The development of additional journal databases will probably
  120. proceed slowly at UC.  We are presently working on the Current Contents
  121. database from the Institute for Scientific Information, which should be
  122. available around the end of 1989. At our present level of effort, we can
  123. mount only two major databases per year, which means that it will be a long
  124. time before we have coverage of any major part of the journal literature.
  125. The process of database selection is complicated by the lack of information
  126. about the relationships among available databases, user needs, and the
  127. materials in the UC collections, although we are beginning to study these
  128. questions.
  129.         The dramatic expansion of public access that began  with online
  130. catalogs and has continued with journal databases leads to a number of
  131. additional developments that have major implications not only for improved
  132. quality of access by library users but also for institutional operations
  133. and costs.
  134.         Delivery of Actual Information. Technical questions arise such as
  135. the form in which information is stored and transmitted, and heavy demands
  136. are made on both storage and transmission facilities. Information delivery
  137. affects the core of the relationships between libraries and publishers and
  138. raises troublesome issues in copyright law. Initiatives in this area also
  139. force an examination of the current system of scholarly publication and its
  140. reinvention in an electronic environment, and of the increasingly painful
  141. costs that the current journal publishing system levy on library
  142. acquisition budgets.
  143.         Preservation, Conservation, and Storage. Libraries must deal with
  144. deteriorating collections. One possible solution is to employ electronic
  145. imaging technology to convert these collections into electronic form, which
  146. both facilitates information delivery and protects the collection.
  147. Libraries cannot afford the building programs required to provide miles of
  148. shelf space annually for new paper acquisitions. Conversion of holdings
  149. into electronic form, and acquisition of new materials in electronic form,
  150. can help libraries cope with this problem too.
  151.         Image Databases and Other Data Resources. Traditionally,
  152. information management has dealt with the printed word. While libraries do
  153. house nonprint collections, such as slides and photographs, these
  154. collections have been considered specialized and difficult to use, and they
  155. have been subjected to restricted access. It is now possible to convert
  156. these collections to electronic form, and to deliver them over networks.
  157. However, massive and expensive indexing efforts will be required to allow
  158. users to search these collections effectively. For example, to convert
  159. images concerning Renaissance Venice into electronic form, each image must
  160. be described (who painted or drew it, where it was done, when it was done,
  161. what artistic techniques were used) and indexed by content (what is in the
  162. picture). The enormous cost of such indexing raises a serious question of
  163. values: Which images are worth indexing to this depth?
  164.         In addition, large new databases are emerging in areas such as
  165. satellite imaging, social-science research, and the geographic sciences.
  166. Most of these databases are inherently multidisciplinary in their appeal,
  167. and most require computer processing as part of their use. These are
  168. increasingly important information resources; the role of the library in
  169. maintaining, managing, and providing access to them remains unclear.
  170.         Institutions face the growing problem of selectively applying the
  171. plethora of current technologies to an abundance of data. They cannot
  172. afford to do everything, but their choices are difficult, because
  173. initiatives in different areas apply unevenly to different scholarly
  174. disciplines.
  175.  
  176.  
  177. Networks and Interinstitutional Library Automation
  178.         Since the late 1960s, libraries have worked cooperatively through
  179. specialized networks centered around two major bibliographic utilitiesOCLC
  180. in Ohio, and RLIN in Californiato reduce the costs of computerized
  181. cataloging.  However, the connection of public access library information
  182. systems to the networks used by researchers is still a very new
  183. consideration. Only in the past year have many libraries offered access to
  184. their online catalogs to their campus user communities outside of the
  185. library. Evidence of the novelty of the concept can be found today in the
  186. deplorably poor support of remote access by most commercially available
  187. library automation systems, where the state of the art lags years behind
  188. the capabilities of typical general-purpose computing systems.
  189.         In 1989, UC began an experimental program offering access to remote
  190. systems for the MELVYL user community. The first system offered was that of
  191. the Colorado Alliance of Research Libraries (CARL); by the time this
  192. article reaches print, about ten additional systems should be available.
  193. Access to these systems is via remote log on using the TELNET protocol used
  194. across the Internet. We expected that interest in remote systems would be
  195. limited by users reluctance to  learn a new interface for each system. What
  196. we did not expect, as we examined the various systems on the Internet that
  197. were available, was the extreme difficulty of making remote login viable.
  198. Many systems assumed specific terminal types and did cursor addressing
  199. specific to that type without prompting for terminal type. Many systems
  200. required the user (or the MELVYL catalog on behalf of the user) to navigate
  201. rather complex dummy login sequences. A surprising number of systems did
  202. not offer any way to log off. More than one system did not appear to work
  203. properly in a TCP/IP (Transfer Control Protocol/ Internet Protocol) network
  204. environment, leading to data loss and frozen terminals.  Based on UCs
  205. experience, the library community on a national level needs to make a great
  206. deal of progress before reciprocal remote log in will be practicable as a
  207. means of obtaining access to resources.
  208.         Even assuming that these technical problems can be worked out, it
  209. is clear that remote login is not a long-term solution. Users cannot be
  210. expected to learn a new interface for each information resource they want
  211. to access. Furthermore, the ability to consolidate and manipulate results
  212. collected from multiple information resources is essential. We must build
  213. information servers (dedicated storage machines accessible through a
  214. network) that will allow users to employ familiar local interfaces to
  215. access remote resources. The technical basis for these information servers
  216. will be the Z39.50 protocol for computer-to-computer information retrieval,
  217. although this will have to be supplemented and extended to provide a
  218. complete real-world solution. The notion of building information servers is
  219. relatively new and has not been explored as part of the overall networking
  220. research and development of the last two decades that has produced
  221. electronic mail, file trans-fer, remote login, and, more recently, such
  222. technologies as Xwindows, remote procedure calls, and network file
  223. systems.
  224.         We do not fully understand the potentials and limitations of trying
  225. to separate a user interface from an information retrieval system. It is
  226. important to realize that this problem is applications-oriented and is
  227. qualitatively different from the types of problems that arise in
  228. distributed database systems. Simply being able to execute queries in a
  229. language such as SQL (Standard Query Language) will not be enough, since
  230. this would demand that the user interface on any one system understand all
  231. of the minutae of imple-mentation at each autonomous remote information
  232. resource it wished to access on behalf of the user. Prototyping projects in
  233. the use of Z39.50 to support public access are just beginning; these
  234. include both workstation implementations of Z39.50 clients and
  235. mainframe-based client and server implementations for major information
  236. resources. A number of educational institutions and other organizations
  237. nationwide are involved in various aspects of these efforts.
  238.         Information servers will be important in many contexts other than
  239. online catalogs and related resources. For example, database publishing in
  240. media such as CD-ROM is problematic for institutions that have made major
  241. commitments to networking technology and resource sharing. In this
  242. environment, a CD-ROM database sits isolated, attached to a PC, with an
  243. idiosyncratic user interface, without network access, and without any
  244. facility to permit the integration of data extracted from the database on
  245. the CD into the users overall computing environment. But if CD-ROM
  246. databases are coupled with information server software, they can be
  247. effectively integrated into the computing environment at an institution.
  248.         Information servers will also be critically important because they
  249. will provide a uniform method for computer programs to extract information
  250. from databases. Today, these databases are used almost solely by human end
  251. users; but we can imagine programs (such as the knowbots proposed by Kahn
  252. and Cerf) that seek out, refine, and manipulate data from these databases
  253. on a continuing basis, once created by human end users.
  254.         Information servers will allow the proliferation of databases as
  255. network resources. This growth will lead to further challenges, perhaps the
  256. greatest of which will be locating and identifying relevant databases to
  257. meet specific information needs. Directories of databases that go far
  258. beyond the current efforts to compile simple lists of resources available
  259. on the national research network will be required. As part of the
  260. development of such directories, it will be necessary to define precisely
  261. the generally available databases. At one end of the spectrum are major
  262. institutionally sponsored databases, such as those of a library; at the
  263. other extreme is a database an individual faculty member mounts on a
  264. workstation and shares with some community members on an informal basis.
  265. Between these two extremes are databases mounted by departments or research
  266. projects that may be of vital interest to specific communities outside an
  267. institution. Universities will need to develop database acquisition,
  268. access, and support policies to ensure that best use is made of the growing
  269. range of database resources.
  270.         As information servers multiply and mature, we will see attempts to
  271. automate even the selection of databases to search. One can envision a user
  272. issuing a query to a search system that first scans local databases at the
  273. users institution and then, if the user wants more information, employs a
  274. rule base that considers search content, time of day, and
  275. interinstitutional arrangements or billing schedules to select a series of
  276. additional databasesand all the user knows is that he or she has told the
  277. system to keep looking.
  278.         Information networks will also provoke new and fascinating policy
  279. questions. Today, many online catalogs, such as MELVYL and  CARL, are truly
  280. public access: anyone can sign on across the Internet without an ID. There
  281. was great concern that these systems would be swamped with outside users,
  282. but extra-institutional use seems to be  about 1 or 2 percent of total load
  283. at present and is not a problem. To put this in perspective, however, both
  284. MELVYL and CARL are rather large systems, and a few percent represents many
  285. thousands of searches per week. As smaller library systems come on the
  286. Internet, there may be a need to protect them from being overloaded by
  287. extra-institutional use. The key question is whether outside use of a
  288. resource is likely to be disproportionate to use by the supporting
  289. institution.
  290.         To answer this question, one must look at the resources that are
  291. being offered and the reasons why outside users would want access to them.
  292. In the case of the MELVYL catalog, users have access to a list of books
  293. held by UC.  This is primarily a catalog of what one can get from the UC
  294. libraries and is useful largely in relation to how easily the person
  295. searching on the MELVYL system can actually obtain the material. To a
  296. lesser extent, simply because of the huge size of the UC collections, the
  297. MELVYL catalog can serve as a bibliographya comprehensive list of material
  298. that exists about a given subject. Smaller monographic catalogs, unless
  299. they are particularly comprehensive in some specific area that the host
  300. institution collects, would serve purely as catalogs and be of interest
  301. chiefly to members of the host institution and perhaps a few other nearby
  302. institutions with well-established resource sharing and inter-library loan
  303. programs. At a national level, the same or equivalent material could be
  304. obtained more easily closer to home. Thus, for catalogs, one can imagine a
  305. situation evolving in which the great majority of users will be satisfied
  306. with their local institutional catalog, perhaps a few other local
  307. institutional catalogs, and possibly (if they are at a small institution)
  308. one or two regional catalogs offered by large research institutions.
  309.         With journal-article abstracting and database indexing, the
  310. situation is very different. These databases are bibliographies, and thus
  311. of equal interest to people everywhere.  To date, there is very little
  312. experience with public access to databases covering the journal literature,
  313. since they are licensed (thus, the MEDLINE license agreement, for example,
  314. prohibits UC from offering MELVYL MEDLINE outside the UC community). It
  315. seems likely that if journal-article abstracting and database indexing are
  316. to become network resources, it will be in the context of
  317. inter-institutional consortia, whose members jointly license the database
  318. for use by the consortium, select one or more members to physically mount
  319. the database, and then reimburse the institution hosting the database for
  320. use by the other consortium members (either directly, or through barter in
  321. situations where different consortium members mount different databases).
  322.         There are difficult economic and policy problems to be addressed in
  323. this environment, both among the participating institutions and between the
  324. consortium and the database provider. For example, institutions may want
  325. flat-rate licenses to databases, so that rational budgeting for database
  326. use is possible and so that their users will not be deterred from
  327. exploiting the database as fully as possible. On the other hand, some
  328. institutions will not use some databases very heavily, and they will want
  329. their costs to take account of actual or both expected level of use and
  330. size of institution. Balance-of-trade questions will have to be negotiated
  331. within consortia. Finally, it seems clear
  332.      that the consortium model described here will make it difficult for an
  333. individual scholar at an institution to have access to the complete
  334. spectrum of information resources, since many resources will be available
  335. only to closed communities. The possibility exists that the forthcoming
  336. database-access environment will tend to force institutions to increasingly
  337. specialize the information resources they provide to their user
  338. communities. It also seems likely that there will be a continuing need for
  339. commercial services to provide access to databases that do not fit within
  340. the mass-use consortium model. Provision of such access (particularly to
  341. databases that are of great interest to scholars and that do not enjoy a
  342. nonacademic user base) may be an increasingly important role for the
  343. bibliographic utilities such as OCLC and RLIN.
  344.         As we look to actual delivery of information, the future is harder
  345. to predict, largely because it is not clear what the economic and legal
  346. models will be. The possibilities range from publisher-controlled servers
  347. providing demand delivery to the educational community, through
  348. university-controlled electronic publishing databases. It is difficult to
  349. know how this will affect the ability of an individual scholar to obtain
  350. electronic access to information. It does seem likely that, as image
  351. collections are converted to electronic form and indexed, they might be
  352. offered through the national network on a public-access basis, much as
  353. online catalogs are being made available today.
  354.  
  355. Conclusions
  356.         We are at the beginning of the development and deployment of a set
  357. of networked information technologies that will evolve and mature in the
  358. 1990s. In the past two decades, computing and communications technologies
  359. have made enormous strides, but we have been less successful in using these
  360. technologies to distribute and provide access to information, particularly
  361. in ways that exploit the intrinsically different characteristics of the new
  362. environments. Online catalogs, for example, began as the automation of an
  363. existing manual function, and we still do not fully understand how they
  364. should differ from their paper-based predecessors. Information technologies
  365. offer much room for innovation.
  366.         In 1970, it would have been difficult to predict how the then
  367. infant computer networking technologies would develop into the national
  368. research network that has changed the world of higher education and
  369. research. Networked information technologies will change the world again in
  370. the 1990snot only in predictable ways, but also in ways that we cannot
  371. foresee because these technologies are so intimately tied to the basic
  372. organizational and social structures of instruction and research.
  373.  
  374. ***************************************************************************
  375. CCNEWS Copyright Notice
  376.  
  377. If you use this article, in whole or in part, in printed or electronic
  378. form, you are legally and morally obligated to credit the author and the
  379. original publication name, date, and page(s). We suggest that you also
  380. inform the author of your intention to use this article, in case there are
  381. updates or corrections that he or she might wish to suggest.
  382.  
  383. If space and format permit, we would appreciate your crediting the "Articles
  384. database of CCNEWS, the Electronic Forum for Campus Computing Newsletter
  385. Editors, a BITNET-based service of EDUCOM." We would also appreciate your
  386. informing us (via e-mail to CCNEWS@EDUCOM) when you use an article, so we
  387. will know which articles have proven most useful.
  388.  
  389. ***************************************************************************